Una Cascada de Transductores Simples para Normalizar Tweets

نویسندگان

  • Iñaki Alegria
  • Izaskun Etxeberria
  • Gorka Labaka
چکیده

A system where several transducer or FST are combined in cascade is presented. Each transducer manages a simple step: learned examples, named-entities, basic misspellings, collapsed words, onomatopoeia words, more complex changes, lowercase/uppercase letters.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Combinación de clasificadores para el análisis de sentimientos

Resumen. El presente trabajo, propone una arquitectura fusionando los clasificadores: SVM, árboles de decisión y Naive Bayes, mediante mayoŕıa de votos, ventanas y cascada, para explorar el desempeño de la tarea de análisis de sentimientos. Se utilizó un corpus en español de 2625 opiniones, previamente preprocesado. Para representarlo, se emplearon bigramas, bolsa de palabras con pesado tf-idf,...

متن کامل

A Sentiment Analysis Model of Spanish Tweets

What people say on social media has turned into a rich source of information to understand social behavior. Sentiment analysis of Twitter data has been widely used to capture trends in public opinion regarding important events such as political elections. However, current research in social media analysis in political domains faces two major problems, namely: sentiment analysis methods implemen...

متن کامل

Generación Automática de Casos de Uso para Desarrollo de Software Basado en Reutilización

Resumen. El desarrollo de software con reutilización se basa en la selección adecuada de elementos reutilizables del repositorio. La generación automática de casos de uso es una opción para acelerar la definición precisa de los requisitos funcionales como paso inicial para el desarrollo de software con reutilización. Por lo anterior, en este artículo proponemos un marco de trabajo para normaliz...

متن کامل

Diseño de Circuitos Lógicos en base a la tecnología FPGA: Un ejemplo de aplicación (Compendio)

Si bien el dispositivo seleccionado es del tipo de Arreglo de Celdas Lógicas (Logic Cell Array, LCA), los criterios de diseño y las herramientas de programación aplicadas son, en lo general, similares a los correspondientes a otras familias de dispositivos FPGA. La razón de esta selección es que los LCA tienen una gran aceptación como alternativa práctica de los tradicionales PLDs, y en algunos...

متن کامل

Clasificación de frases obscenas o vulgares dentro de tweets

Resumen. Se propone una metodología para la detección frases obscenas y vulgares en los tweets, debido a que México es uno países donde se usa mucho el doble sentido para comunicarse. La metodología propuesta se apoya en un diccionario de mexicanismos etiquetado manualmente por expertos. Se pudo detectar que las palabras obscenas y vulgares son las que más se emplean y los estados del país que ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013